library(tidyverse)

load(here::here('data/data.RData'))

data %>% 
  filter(!is.na(DE))
data %>% 
  filter(!is.na(DE)) %>%
  separate_rows(DE, sep = ";|,")  %>% 
  mutate(
    DE = str_trim(DE) %>% str_to_lower(.) %>% str_remove(.,";")  %>% stringi::stri_trans_general(.,"Latin-ASCII")
  ) %>%   group_by(DE) %>%
  mutate(DE = case_when(
    DE == "brazil" ~ 'brasil',
    DE == "asia-pacific" ~ "asia-pacifico",
    DE == 'brazilian foreign policy' ~ 'politica externa brasileira',
    DE == 'politica externa do brasil' ~ 'politica externa brasileira',
    DE == "brazil's foreign policy" ~ 'politica externa brasileira',
    DE == 'foreign policy' ~ 'politica externa',
    DE == 'united states' ~ 'estados unidos',
    DE == 'eua' ~ 'estados unidos',
    DE == 'us' ~ 'estados unidos',
    DE == 'south america' ~ 'america do sul',
    DE == 'latin america' ~ 'america latina',
    DE == 'international relations' ~ 'rela?oes internacionais',
    DE == 'relacoes internacionais' ~ 'rela?oes internacionais',
    DE == 'international security' ~ 'seguranca internacional',
    DE == 'regional integration' ~ 'integracao regional',
    DE == 'international politics' ~ 'politica internacional',
    DE == 'mercosur' ~ 'mercosul',
    DE == 'european union' ~ 'uniao europeia',
    DE == 'geopolitics' ~ 'geopolitica',
    DE == 'terrorism' ~ 'terrorismo',
    DE == 'human rights' ~ 'direitos humanos',
    DE == 'development' ~ 'desenvolvimento',
    DE == 'democracy' ~ 'democracia',
    DE == 'us foreign policy' ~ 'politica externa dos eua',
    DE == 'american foreign policy' ~ 'politica externa dos eua',
    DE == 'politica externa dos estados unidos' ~ 'politica externa dos eua',
    DE == 'politica externa norte-americana' ~ 'politica externa dos eua',
    DE == 'south-south cooperation' ~ 'cooperacao sul-sul',
    DE == 'international institutions' ~ 'instituicoes internacionais',
    DE == 'defense' ~ 'defesa',
    DE == 'globalization' ~ 'globalizacao',
    DE == 'regionalism' ~ 'regionalismo',
    DE == 'south africa' ~ 'africa do sul',
    DE == 'teoria de relacoes internacionais' ~ 'teoria das relacoes internacionais',
    DE == 'international relations theory' ~ 'teoria das relacoes internacionais',
    DE == 'theory of international relations' ~ 'teoria das relacoes internacionais',
    DE == 'teoria de relacoes internacionais' ~ 'teoria das relacoes internacionais',
    DE == 'ir theory' ~ 'teoria das relacoes internacionais',
    DE == 'foreign policy analysis' ~ 'analise de politica externa',
    DE == 'climate change' ~ 'mudan?as climaticas',
    DE == 'mudanca climatica' ~ 'mudan?as climaticas',
    DE == 'cambio climatico' ~ 'mudan?as climaticas',
    DE == 'global governance' ~ 'governan?a global',
    DE == 'governanca global' ~ 'governan?a global',
    DE == 'international organizations' ~ 'organizacoes internacionais',
    DE == 'international trade' ~ 'comercio internacional',
    DE == 'organizacao das nacoes unidas' ~ 'onu',
    DE == 'nacoes unidas' ~ 'onu',
    DE == 'organizacao das nacoes unidas (onu)' ~ 'onu',
    DE == 'un' ~ 'onu',
    DE == 'united nations' ~ 'onu',
    DE == 'unasur' ~ 'unasul',
    DE == 'cooperation' ~ 'cooperacao internacional',
    DE == 'coperacao' ~ 'cooperacao internacional',
    DE == 'cooperacao'~ 'cooperacao internacional',
    DE == 'international cooperation' ~ 'cooperacao internacional',
    DE == 'cooperacion' ~ 'cooperacao internacional',
    DE == 'cooperacion sur-sur' ~ 'cooperacao sul-sul',
    DE == 'cooperacion sur ?sur' ~ 'cooperacao sul-sul',
    DE == 'integracion regional' ~ 'integracao regional',
    DE == 'integracion regional:' ~ 'integracao regional',
    DE == 'america del sur' ~ 'america do sul',
    DE == 'relaciones internacionales' ~ 'rela?oes internacionais',
    DE == 'mercosur/mercosul' ~ 'mercosul',
    DE == 'desarrollo' ~ 'desenvolvimento',
    DE == 'naciones unidas' ~ 'onu',
    DE == 'derechos humanos' ~ 'direitos humanos',
    DE == 'defence' ~ 'defesa',
    DE == 'international political economy' ~ 'economia politica internacional',
    DE == 'geopolitic' ~ 'geopolitica',
    DE == 'union europea' ~ 'uniao europeia',
    DE == 'hegemony' ~ 'hegemonia',
    DE == 'republica popular da china' ~ 'china',
    DE == 'seguridad internacional' ~ 'seguranca internacional',
    DE == 'multilateralism' ~ 'multilateralismo',
    DE == 'world trade organization (wto)' ~ 'wto',
    DE == 'gatt/wto' ~ 'wto',
    DE == 'organizacao mundial do comercio' ~ 'wto',
    DE == 'omc' ~ 'wto',
    DE == 'gatt/omc' ~ 'wto',
    DE == 'world trade organization' ~ 'wto',
    DE == 'multilateral forums' ~ 'foruns multilaterais',
    DE == 'security' ~ 'seguranca',
    DE == 'seguridad' ~ 'seguranca',
    DE == 'defensa' ~ 'defesa',
    DE == 'armed forces' ~ 'forcas armadas',
    DE == 'international law' ~ 'direito internacional',
    DE == 'integration' ~ 'integracao',
    DE == 'integracion' ~ 'integracao',
    DE == 'african union' ~ 'uniao africana',
    DE == 'governo lula da silva' ~ 'governo lula',
    DE == 'lula administration' ~ 'governo lula',
    DE == 'luiz inacio lula da silva government' ~ 'governo lula',
    DE == "lula's administration" ~ 'governo lula',
    DE == "lula's government" ~ 'governo lula',
    DE == 'lula government' ~ 'governo lula',
    DE == "lula?s government" ~ 'governo lula',
    DE == 'governo de lula' ~ 'governo lula',
    DE == 'governo de lula da silva' ~ 'governo lula',
    DE == 'governo luis inacio lula da silva' ~ 'governo lula',
    DE == 'luis inacio lula da silva?s government' ~ 'governo lula',
    DE == 'governo fernando henrique cardoso' ~ 'governo fhc',
    DE == 'fernando henrique cardoso administration' ~ 'governo fhc',
    DE == 'fernando henrique cardoso government' ~ 'governo fhc',
    DE == 'administracao bush' ~ 'governo bush',
    DE == 'bush administration' ~ 'governo bush',
    DE == 'george w bush administration' ~ 'governo bush',
    DE == 'governo de dilma rousseff' ~ 'governo dilma',
    DE == 'dilma rousseff administration' ~ 'governo dilma',
    DE == 'governo dilma rousseff' ~ 'governo dilma',
    DE == 'politica exterior' ~ 'politica externa',
    DE == 'politica exterior brasileira' ~ 'politica externa brasileira',
    DE == 'politica exterior brasilena' ~ 'politica externa brasileira',
    DE == 'politca exterior brasileira' ~ 'politica externa brasileira',
    DE == 'politica exterior dos eua' ~ 'politica externa dos eua',
    DE == 'paraguay' ~ 'paraguai',
    DE == 'analise da politica externa' ~ 'analise de politica externa',
    DE == 'analise da politica externa (ape)' ~ 'analise de politica externa',
    DE == 'peace operations' ~ 'operacoes de paz',
    DE == 'peacekeeping operations' ~ 'operacoes de paz',
    DE == 'un peacekeeping mission' ~ 'operacoes de paz',
    DE == 'power' ~ 'poder',
    TRUE ~ DE
  )) %>%
  count() %>%
  arrange(desc(n)) %>%
  View()


